Краткий анализ работ по распознаванию образов
Проблема распознавания образов в настоящее время охватывает широкий круг задач, связанных с чтением букв, распознаванием речи, автоматическим управлением, с технической и медицинской диагностикой, с обучением автоматов и разработкой адаптивных систем.
Применение алгоритмов распознавания образов в перечисленных выше областях начинает давать ощутимые практические результаты. Известно, например, что диагнозы, поставленные с помощью вычислительной машины «Минск», содержали в Г5 раз меньше ошибок, чем при обычной клинической практике (при локализации опухолей головного мозга).
При решении сложных проблем эксплуатации авиационной техники по состоянию по существу могут быть использованы модели, применяемые в области распознавания образов и основанные на использовании аппарата многомерной математической статистики. При эксплуатации авиационной техники по состоянию объем назначаемых работ по обслуживанию является случайным. При назначении этого объема первоначально решается простейшая задача распознавания образов при наличии двух классов состояния — исправного и неисправного. Эти классы состояний характеризуются многими случайными параметрами. Задача отбора признаков (контролируемых параметров), как мы увидим. ниже, также решается в рамках задач распознавания образов. Далее диагностика состояния при классификации техники как «неисправная» может быть сформулирована как типовая задача распознавания образов (с позиций распознавания образов могут быть, на наш взгляд, рассмотрены и некоторые задачи определения отказовых ситуаций оператором и другие эксплуатационные проблемы).
Весьма схематично типовую задачу распознавания образов можно сформулировать так. Необходимо распознать ситуацию k, принимая решение d. Решение принимается на основании результатов экспериментов о. Зависимость v от k характеризуется распределением условной вероятности p(vjk). Правильность принятого решения определяется величиной потерь L(k, d), соотносящей ситуацию k и решение d. Необходимо, чтобы принимаемые решения d(v) при поступлении результатов наблюдений v давали минимальное математическое ожидание потерь. Такая статистическая постановка задачи распознавания имеет много общего с известной задачей выделения сигналов иа фоне шумов.
Для практического внедрения результатов теории распознавания образов необходимо изучать свойства алгоритмов и принимаемых решений, предназначенных для реализации с помощью ЦВМ. При этом для решения задач распознавания образов применяются и методы исследования, получніїїіііщ |ы піні нс в несколько других областях. Так, например, уже сейчас находит примі ін мис алгоритм последовательного планирования эксперимента при нсследоимшмі решающего правила для двухклассовой статистической задачи клип нфітлцнн. Одиако следует отметить, что несмотря на появление в последние гиды большого числа специальных публикаций, проблема распознавания обрпти как научное направление до сих пор еще не может считаться ясно определенной, так как подавляющее большинство работ по распознаванию образин ноеюнцено анализу частных схем (хотя имеются работы по методологическим попрое їм распознавания образов). Во многих случаях задачи распознавания обрії шн трактуются как задачи математической статистики и теории статистических решений, применяются методы линейного, целочисленного и динамического иршрам — мироваиия. Для решения задач распознавания часто используют пт же метод стохастической аппроксимации и алгоритмы адаптации, байесовы оценки, метод потенциальных функций, дискриминантный и последовательный днплні. метод экстраполяции функций в условиях неопределенности, вариационный метод. Все эти методы в некотором смысле математически подобны, так как обладают одинаковым типом сходимости. Однако с практической точки зрения следует принять во внимание особенности получения необходимой априорной информации и трудности реализации различных вычислительных методов. Процессы обучения с корректировкой и без корректировки, использующие параметрические и непараметрические процедуры оценок, могут в общем случае расе мл гран.) пая как проблема последовательной оценки неизвестных параметров. С. тсдусі отметить, что использование при распознавании метода стохастической аппроксимации позволило получить новые результаты. В литературе, относящейся к ітой области, часто используется теорема стохастической аппроксимации, принадлежащая Дворецкому.
Рассмотрим отдельные наиболее типовые подходы в области распознавания и в смежных с ней областях.
Отбор признаков. Важным этапом в процессе распознавания является отбор признаков, по которым производится распознавание образа, и выявление связей между отобранными признаками.
Учет зависимости между отобранными для распознавания признаками позволяет извлечь большее количество полезной информации для проведения правильной классификации. В литературе отмечается, что малоинформативные, но сильно коррелированные признаки в общем случае могут составить высокоинформативную расиознанающую систему.
Информативность двух сильно коррелированных признаков может быть равна информативности одного из них. Волге того, оказалось, что широко распространенное мнение о том, что при наличии сильной стохастической, а тем более функциональной линейной зависимости между двумя признаками одним из них можно без ущерба пренебречь, справедливо лишь для отдельных частных случаев, в общем же случае правильным оказывается противоположный вывод. Поэтому возникает проблема: нельзя ли при исследовании многопараметрических объектов отбросить часть параметров и заменить нх меньшим числом каких-либо функций от них, сохранив при этом вею полезную информацию. Эта проблема является основной проблемой факторного анализа как стохастического метода.
В литературе предлагается способ отбора признаков, при котором и качестве критерия оптимальности принят так называемый обобщенный критерий Фишера, и показывается, что признаки, выбранные предложенным смпепГилі, являются более информативными.
Интересна проблема отбора признаков и одновременного принятии рі шення о распознавании образов. Пусть имеется несколько классов обьсктпи, харікіе — рнзующихся /г-мерными векторами признаков.
Для решения задачи распознавания можно рассмотреть іісгіниі. ічі ни нінз — мененный специальный случай последовательной процедуры Ншімл іи» тсдо — вательный критерий отношения вероятностей. Оказываете», чіп іі|шіі|ніН ( ия классификации), основанный на последовательных решениях ни пи о и (m. ice «ВЫГОДНЫМ», чем критерий, получаемый при фиксирошіїїішм Mill II ІІнГі Ни Іі’ІІНЙ (признаков). Поясним это утверждение. Если имеется itiu піннії ( Яц
^объект принадлежит к первому классу) и единственная конкурирующая гипотеза Н2 (объект принадлежит ко второму классу), то на k-м шаге отношение вероятностей равно Р (Хк! Ні)
Aft = р Iff ^ ~ * ГДе — ^-мерный вектор, компоненты которого являются
характеристиками рассматриваемого объекта (предполагается, что параметры условных распределений Р(Х/Ні) были оценены по результатам нескольких «пробных» наблюдений).
Область принятия гипотез Hi и Н2 имеет вид:
{Х-Л>В}, Х-Л<Л, Л<В.
В обоих случаях происходит «остановка» выбора признаков, объект относится к соответствующему классу и вероятности Р(Х/Ні), і= I, 2 переоцениваются. Затем классифицирующее устройство переходит к следующему объекту. Если Льє(Л, В), то классификация не производится и процедура отбора признаков продолжается. При достаточно большом числе испытаний (по сравнению ■со средним числом испытаний до момента «остановки») классификация для каждого объекта с высокой вероятностью будет проведена до конца. При этом можно улучшить описанную процедуру, если исходя из нескольких пробных испытаний проранжировать характеристики классифицируемых объектов таким образом, чтобы наиболее существенные из них были расположены вначале (использовались первыми при распознавании объектов).
Сейчас уже в достаточной степени изучен вопрос об учете стоимости выбираемых для распознавания образов признаков. Оказывается, что в этом случае задача оптимального распознавания с успехом решается методом динамического программирования. На основе этого метода может быть построена и оптимальная система распознавания—оптимальный классификатор, способный выбирать наилучшую последовательность признаков.
Существует и метод выбора и упорядочивания признаков в системе для распознавания образов, не требующий вычисления вероятности неправильного распознавания или полных знаний о распределении вероятностей рассматриваемых образов. Основная идея этого метода заключается в предварительном «взвешивании» признаков в соответствии с их относительной важностью при описании образов. Причем «взвешивание» не зависит от решающего правила, используемого при распознавании. При этом вводится определение важности признака и критерий для ее определения, затем уже можно описать процедуру выбора и упорядочения признаков.
Важную роль в процессе распознавания образов играет и предварительная обработка информации о признаках перед принятием решения о распознавании с целью улучшения точности распознавания и снижения требований к памяти вычислителя. Здесь возникают вопросы минимизации числа признаков и отбора признаков в случае их пересечения. О трудности решения этих и близких к ним вопросов свидетельствует такой факт: наличие в образе перекрывающихся ячеек делает либо малоэффективными, либо просто неприменимыми некоторые традиционные методы распознавания образов.
Для выбора признаков в настоящее время предлагается использовать физический, топологический, математический (по энтропии) и статистический методы. Существует даже процедура, обосновывающая отыскание и вычеркивание избыточных признаков с общих позиций бионики, при этом рассматривается возможность сравнений различных алгоритмов распознавания, если используются одни и те же признаки.
Типовые алгоритмы распознавания образов. Рассмотрим алгоритм, примыкающий к алгоритмам М. М. Бонгарда и В. Л. Браиловского [66]. Этот алгоритм является развитием известного метода «КР-наборов», предложенного В. Броунингом и Г. Бледшо [82]. Пусть каждый образ представляется также л-мерным двоичным вектором X и может принадлежать одному из N классов. Обучение основывается на выборках объема S из каждого класса: хц, i=l,…,N; /= = 1,…, 5. Алгоритм обучения заключается в следующем: случайно выбираются р из п координат и для данного X из вышеупомянутой выборки строится вектор fi(x) = {/i, o(x), /i, iW / _ где fu=l, если на местах с выбраи-
1,2 1>
ными координатами стоит двоичное число /, —1. Для nuCpuiiiioio Хц
такая процедура производится k раз, в результате чего полупится інмор f{x) = {fi(x),…, fa(x)}.
Для каждого хц эти k подмножеств координат одни и те же, Ни осінша-
I ^ ^ I
нии полученной таким образом матрицы <2 / (xij) > • • •. / ( ‘"/v / м "оный
1/-1 У-1 I
вектор X относится к классу, для которого скалярное произведение / (лij)X
X/ (.*:) максимально, i= I………. N. Математическое ожидание МІ У, / {хц) ражается через величины т(хцх)—число общих координат у иск горой х0х. В литературе исследована вероятность правильного распознавании лот алгоритма для больших выборок (при S->■ оо) и разбирается его сини. г ncгодом стохастической аппроксимации.
Многие задачи распознавания образов успешно решаются в предположении гауссоности распределения признаков. Типична здесь следующая ситуация. Пусть имеется N классов: х±,…, xN. С классом х, связано распределение
P(X/0j) с неизвестным параметром 0f. Для каждого класса известны……………….. рное
распределение параметра 0; и выборка объема пи подчиненная распределению Р(Х/ві). Имеется наблюдение X, которое подчинено одному из распределений Р{Х/в;), (=1,… N, неизвестному для наблюдателя. Требуется определить с возможно меньшими вероятностями ошибок, к какому классу относится. V. Решение получено в случае, когда Р(Х/ві)—многомерные гауссовские распределения, параметры которых неизвестны. Предлагается на основании имеющихся предварительных выборок объемов П; построить выборочные средине Ці и ковариационные матрицы Ф,- и сравнивать величины
(Х-цО’ФгСХ— ц;), і — I…………. N.
Следует отметить, что допущение многомерной нормальности распределения является общим для большинства статистических методов. Однако обоснованность такого допущения исследуется редко. Известны примеры распределения случайных величин безусловно покомпонентно нормальных, но не являющихся многомерно нормальными. В практически интересных случаях число необходимых данных для проверки по этому критерию растет чрезвычайно быстро с ростом числа измерений, что не позволяет провести полную проверку. Поэтому предлагается методика построения частичных процедур проверки многомерной нормальности. Существуют численные примеры, показывающие, как частичная проверка позволяет обнаружить распределение, безусловно нормальное по всем переменным, но не являющееся многомерно нормальным.
Предположение о том, что в задачах распознавания образов многомерные распределения вероятностей для разных классов являются гауссовскими и имеют равные матрицы ковариаций, может привести к потере информации, заключающейся в наличии корреляционных связей между признаками. Поэтому в литературе начинают появляться работы, в которых рассматриваются приближения распределений, отличные от нормальных: оптимальное приближение л-мериого дискретного распределения вероятностей р(хI. . . Хп) с помощью распределения с «деревом» зависимостей первого порядка. В качестве меры близости при этом используется мера информации и утверждается, чіп применение процедуры к опытным данным приводит к максимально прандоиочобной оценке распределения.
Известна интересная задача классификации образов по принципу. чгед — ства». Согласно этому принципу, неклассифицированной точке и іі[»и ір. шгтве
образов ставится в соответствие ближайшая из множеств кліцтш|»іііприіі………….. их
точек. Особенность этого метода распознавания заключается н тим, чиї ка. к юй новой точке в пространстве образов ставится в соответствие лишь пни ычка
из точек, относящихся к классифицированным образам. Перонний: и……….. п‘>кн в
данном случае меньше, чем суммарная ошибка, получиемни при nr in и. нныппи метода Байеса.
Рассмотрим типовую постановку задачи распознавания образов с позиций дискриминантного анализа. Как нам уже известно, в задачах классификации обычно необходимо однозначно сопоставить объект, характеризуемый наблюдаемым числом или вектором у, и один из k классов при известных соответствующих плотностях распределений Pi {уф), i== I,…, /г, р —чаще всего обозначает вектор параметров, который, как правило, неизвестен. Поэтому часто вместо значения В подставляется оценка этого вектора, полученная по результатам так называемой облучающей или управляющей выборки для каждого і ИЗ популяций с ПЛОТНОСТЬЮ Pi (уф).
Таким образом, задача классификации решается обычно после решения задачи оценивания вектора р. Можно решать одновременно задачу классификации и задачу оценивания. Для этого введем вектор 0= (0і, …, 0„) «параметров решения»: 0,-=1, если наблюдаемый объект отнесен к i-му классу, и 0і = О—в противном случае. В силу единственности решения и обязательного его принятия всегда 2 ®/ = I ■ Совместная задача классификации и оценивания
і
сводится поэтому к задаче оценивания параметров 0, р. Далее можно рассмотреть решение следующих вариантов описанной выше задачи в предположениях, типичных для дисперсионного анализа — оценка максимального правдоподобия при классификации одного объекта (в предположении одномерности и нормальности плотностей Рі(уф) с неизвестными дисперсиями и средними выводятся оценки максимального правдоподобия для параметров этих распределений и для вектора 0 параметров решений); .оценка максимального правдоподобия при одновременной классификации т(т>) объектов (здесь предположение о распределении объектов аналогично предположению первой задачи); решение задачи одношаговой классификации, задачи классификации по подгруппам при известной классификации ‘по группам и задачи двухшаговой классификации (здесь использованы обычные линейные модели дисперсионного анализа).
В большинстве работ по распознаванию в качестве основного критерия используется вероятность неправильной классификации либо некоторая функция риска от неправильной классификации, однако существует и другой критерий для проведения классификации — критерий полезности, имеющий некоторые преимущества по сравнению с известными критериями.
В последние годы большое внимание уделяется задаче распознавания образов, признаки которых являются случайными функциями времени.
Пусть каждому образу соответствует некоторый входной сигнал распознавания — случайная функция с определенным распределением вероятностей (для каждого заданного класса образов). Если заданы эти распределения вероятностей, а также априорные вероятности появления образов различных классов, то методами теории статистических решений можно найти оптимальный — алгоритм, однозначно устанавливающий для каждого данного входного сигнала распознавания соответствующий ему класс образов. Уже найдены такие алгоритмы (обучения и самообучения), которые являются оптимальными байесовыми алгоритмами.
Они обеспечивают максимальное использование информации, содержащейся в обучающих реализациях сигналов.
Многие исследователи идут по пути разработки общих подходов к машинному распознаванию образов и эвристических методов, дополняющих математические подходы. При этом создаются подробные алгоритмы всех стадий обработки данных, анализа входных и выходных данных и описываются части общей программы: обучение—формирование понятий в памяти ЦВМ; сокращение описания понятий — изменение структуры записи для сокращения занятого объема памяти и опрос — обработка, выясняющая соотношение двух понятий (равенство их или включение одного понятия в другое). Один из общих подходов к созданию машинных алгоритмов заключается в том, что на основании идеи «расширения состояний» предлагается метод уменьшения размерности при решении задач распознавания образов, обнаружения неисправностей в сложных системах, задачи о назначениях и некоторых задач управления.
Важным шагом при решении задач распознавания образов на ЦВМ является принципиальная оценка возможности получения решения. Имеется пример получения отрицательного результата — в случае, когда рассматривается мно-
|
жество А положительных целых чисел, записанных и двоичном коде. Оказывается, что некоторые из видов множеств А являются нерегулярными в том смысле, что их невозможно распознать с помощью вычислительной машины с конечным числом состояний.
Рассмотрим кратко некоторые алгоритмы с адаптацией. (Іростеппіпс задачи распознавания с адаптацией сводятся к разработке процедуры непрерывной оценки коэффициентов разделяющей поверхности при классификации на два класса. Предполагается, что множества признаков классов являются выпуклыми непересекающимися подмножествами пространства R". Доказываются теоремы о существовании разделяющей поверхности. Теоремы иллюстрируются геометрическими построениями. Рассматриваются некоторые простые решающие адаптивные процедуры, включающие в себя правила разбиении « мерного пространства на две области с помощью гиперсферы.
Существует и адаптивная система распознавания образов более сложного вида (исследовалась система, содержащая достаточно общее правило построения линейных или кусочно-линейных дискриминантных функции дли разделения образов на несколько классов). Адаптивная процедура и этом случае представляет собой процесс обработки групп образов. Обучающая последовательность состоит из групп векторов в матричной форме вместо обычно используемой последовательности векторов. Доказывается, что адаптивная процедура сходится за конечное число шагов, если решение существует, п рассматриваются необходимые и достаточные условия линейной разделимости каждого подиабора из d+l образов. Предложенная процедура может быть реализована путем незначительного усложнения существующих систем распознавания образов (систем без адаптации). В публикациях приводятся интересные результаты моделирования таких алгоритмов на ЦВМ.
Еще один типовой подход к распознаванию образов с адаптацией сводится к следующему, изучается система классификации объектов, в которой принимаются два решения относительно наблюдаемых объектов: первое — «скорое», на основании неточных значений условных вероятностей получаемых наблюдений при различных гипотезах о наблюдаемых объектах; второе — вполне точное, основанное «а некоторой дополнительной информации. Результаты точного решения используются для корректировки упомянутых условных вероятностей. При этом рассматривается скорость сходимости такой процедуры к оптимальному байесову решению. Оказывается, что эта скорость сходимости определяется средней длительностью получения второго решения, которая зависит от статистической неопределенности «скорого» решения.
Учет деятельности человека в системах распознавания образов. Перейдем к рассмотрению эвристических подходов в задачах распознавания образов. Пусть некоторый статистический источник создаст бинарную последовательность £( из символов А и В. Требуется определить статистическую структуру этой последовательности. Если предположить, что последовательность Et есть сложная цепь Маркова некоторого порядка, то можно оценить последовательно условные вероятности p(A/Sn), где Sn—последовательность событий длины п. Процесс прекращается, если по критерию %-квадрат p(A/Sn)=p(A/Srt, А) = =p(A/Sn, В), или п=по.
Существует и более общая процедура, основанная на оценке всех условных вероятностей одновременно с n^«i — Для получения последовательности Et использовались способности человека к — предсказанию: индивидууму пооче
редно показывали карты с символами А и В, соответствующими последовательности £(. Перед показом следующей карты индивидуум предсказывал ее, причем эти его предсказания запоминались. Последовательность £, являлась двоичной функцией от последовательности состояний источника с числом состояний большим двух и представляла собой цепь Маркова. Исследовалось, какие состояния источника индивидуум «отличает» и в каком порядке, влияние предсказаний ранних на более поздние, отличие стратегии предсказания индвидуума от вышеупомянутой процедуры оценки. Уже имеются интересные численные результаты экспериментов и указано, что способность человека к предсказанию оказалась неожиданно высокой. Затронутым выше вопросам исследования человека как датчика информации (с учетом опыта человека и его тренированности) посвящен фундаментальный труд [84].
В настоящее время возрастает стремление к исследованию искусственного интеллекта. Область иссследоваиия искусственного интеллекта пока четко не определена. Большинство форм поведения человека может быть представлено в виде программы автоматов, но искусственный интеллект должен включать и то, что не укладывается в обычную программу. По мнению ряда авторов, сейчас имеются два основных направления исследований искусственного интеллекта: разработка программ возможных преобразований для получения определенных результатов, не вникая в суть механизмов мозга, и моделирование доступных механизмов мышления. Пока неизвестно, всегда ли поведение человека полностью детерминировано. В то же время показано, что возможности вероятностных автоматов ие превосходят возможности детерминированных, поэтому считается, что концепция детерминизма целесообразнее при изучении искусственного интеллекта. При анализе поведения человека используется тактика поиска экстремума — это применимо к играм, доказательству теорем, распознаванию образов. При этом важную роль играет обучение. В основном пока преобладает подход, связанный с исследованием восприятия человеком и принятия им решений.
При распознавании образов главную роль играют признаки изображений. Нейрофизиологические исследования раскрывают некоторые механизмы выделения признаков в нервной системе (например, в глазу лягушки и зрительной коре кошки открыты детекторы простых частей изображений).
Задачи распознавания образов, решаемые человеком, имеют три разновидности: решение задачи при заданном законе классификации; при наличии обучающей последовательности, в которой известна принадлежность изображений классам; создание человеческим мозгом классификации заданных изображений на определенное число классов. Формальное воспроизведение алгоритмов, по которым осуществляется решение последних двух задач в мозгу человека, является сложным. Все существующие алгоритмы распознавания, как не раз отмечалось выше, работают в два этапа: при обучении выделяются признаки изображения, по которым затем принимается решение на проведение классификации. Задача полностью разрешима, когда можно найти пространство измерений, в котором выполняется требование компактности (например, линейное преобразование пространства измерений, как было показано Г. Себестианом (51], является ортогональным преобразованием, позволяющим достичь компактности изображений).
Р. Веллманом 174] в популярной форме изложены имеющиеся на сегодняшний день сведения о структуре и деятельности мозга. Рассмотрены модели таких явлений, как память, способность мозга распознавать образы, процессы решений и способность к обучению. Особое внимание уделено рассмотрению моделей процессов принятия решений, показана многоступенчатость этих процессов. Р. Веллманом делается попытка оценить возможности человеческого разума в будущем. Опубликованные работы по исследованию искусственного интеллекта — лишь начало решения огромной научной проблемы. Однако уже сейчас можно сказать, что приложения результатов исследований искусственного интеллекта весьма многообразны: автоматическое распознавание образов различной природы, автоматический перевод, разговор с машиной, модели сенсорных систем и восприятия, принятие решений машиной, модели управления, управления с эвристическим поощрением и др. Все чаще появляются работы, в которых рассматриваются задачи классификации с помощью экспертов и ставится вопрос: что выгоднее — иметь мало высококвалифицированных экспертов или много экспертов низкой квалификации.
Отметим также, что модели, учитывающие эффект участия человека при решении различных технических задач, безусловно, далеко не совершенны. Однако несмотря на то, что точность используемых здесь методов может подвергаться сомнению, количественный подход при решении упомянутых задач более эффективен, чем отказ от такого подхода.
Технические средства распознавания образов. В настоящее время считается решенным вопрос об отделимости двух классов сетью из пороговых элементов (имеется эффективный алгоритм и некоторые условия отделимости). Создаются распознающие системы, использующие модель нервной клетки как аналоговое пороговое устройство. Электронной моделью нервной клетки служит блокирую-
щий осциллятор, управляемый напряжением. Появляются итеративные системы обучения распознаванию, в литературе приводятся формулы логических переключательных функций, используемых при распознавании, и даются блок-схемы аппаратуры реализации алгоритмов распознавания.
Для анализа задач распознавания образов большой размерности требуется устройство обработки сигналов, обладающее следующими особенностями: возможностью быстрой обработки большого количества информации, многообра — зованием операционных функций и гибкостью системной структуры.
Введение учета времени в устройства распознавания в качестве равноправной координаты аргументируется упрощением процесса распознавания, так как при этом сглаживается характер различий между проблемами распознавания и искусственного интеллекта.
В настоящее время обоснована схема нейронной сети, способной обучаться распознаванию образов. Основные характеристики нейронов, из которых построена сеть, соответствуют известным физиологическим данным. При этом учтены также и некоторые результаты самых последних исследований. Предлагаемая сеть способна хорошо различать образы даже при сильных искажениях.
Уже созданы такие устройства, как генератор искусственных образов для распознавания, которые предлагается использовать вместо естественно получаемых выборок натуральных образов. При условии, что угадана природа искажений, порождающих нужный класс, такой метод оказывается ‘существенно более удобным и дешевым.
Предлагаемый генератор в качестве эталонного образа может использовать любое изображение, например, осциллограмму, письменный знак или фотографию. Набор допустимых преобразований включает в себя при этом как деформации плоскости изображений типа растяжений по осям хну, поворота и сдвига, так и разного рода контролируемое «зашумлеиие».
Монографии и сборники по распознаванию образов. В сборнике [2] рассматриваются вопросы разработки специализированного математического обеспечения для распознавания речевых сигналов на ЭВМ и создания специальной аппаратуры. Обсуждаются также вопросы автоматического распознавания речи. Обзор работ в этой области содержится в [2].
В приложении к монографии Г. П, Шибанова [66] имеется содержательный обзор по вопросам іметодологии ‘распознавания ‘Образов, насчитывающий 176 наименований. Сама монография Г. П. Шибанова представляет большой интерес для специалистов, использующих в своей деятельности приемы и методы распознавания образов, в ней содержатся также конкретные технические решения и практические реализации распознающих устройств весьма универсального характера.
В книге Б. Батхелера [71] уделено основное внимание эвристическим и экспериментальным приемам распознавания образов. Наиболее важным в инженерных проблемах автор считает нахождение эффективных алгоритмов, учитывающих стоимость и скорость выполнения процедуры распознавания. В книге описаны методы классификации образов, даны сравнения классификаторов, рассмотрена их конструкция, применение и даны прогнозы иа будущее. Ряд интересных работ по использованию методов прикладной статистики при решении задач распознавания образов содержится в работе [69].
В сборнике [44] излагаются нелинейные и линейные методы распознавания образов, предназначенные для решения широкого класса практических задач.
История развития работ по распознаванию образов излагается в [19], обсуждается идеология развития перспективных методов в создании распознающих систем, рассматриваются методы анализа сигналов и выделения признаков, описываются разработанные в лаборатории (США) РАДС ‘некоторые системы распознавания образов, обсуждаются результаты проведенных экспериментов.
В [55] видным японским специалистом по распознаванию образов Танакой Кокити дай анализ существующих считывающих и распознающих устройств, их быстродействия и надежности. Монография [71] также посвящена проблемам распознавания образов. В ней отмечается, что при выборе того или иного алгоритма классификации авторы останавливаются на его практической полезности, хотя порой не дают достаточного математического обоснования. В связи с этим широко применяется эвристическое программирование.
Приводятся практические рекомендации и обсуждаю гея особенное і и реп лизании различных классификаторов, описываются приложения в технике, медицине и других областях и обсуждаются перспективные направленна в классификации образов.
В [92] рассматриваются решающие функции, методы классификации образов, детерминистский и статистический подходы при обучении классификаторов. Уделено также внимание предварительной обработке входных данных и методам отбора признаков.
Состояние проблемы распознавания образов с позиций ее значимости в различных областях человеческой деятельности дано в (50]. В книге отмечается, ■что в эпоху иаучио-техиической революции существенно возрастают требования к технике обработки информации. С этим связано и развитие теории распознавания образов и широкое распространение распознающих устройств в последние годы. Здесь отмечается также, что начало фундаментальных исследований в области распознавания относится к 1966 г. Отмечается, что совершенствование — аппаратуры для распознавания различного рода информации во многом будет зависеть от успехов микроэлектроники, совершенствования операционных систем ЭВМ. Указываются следующие направления работ: специализированные системы обработки информации для использования в промышленности, на транспорте и других областях, обладающие возможностями распознавания одного вида ■специальной информации; системы для распознавания букв и цифр, схем и чертежей, материалов и веществ по химическим и физико-механическим свойствам, звуковых сигналов, естественной речи, математических знаков и. выражений; обучающиеся и обучаемые системы; специализированные операторы, языки и операционные системы дли распознавания, специальные технические средства (читающие устройства, память, многопроцессорные микро-ЭВМ и т. д.). Важность работ по проблеме распознавания подчеркивается тем обстоятельством, что в США, например, они проводятся при участии управления космических исследований (NASA), национального института здравоохранения и управления перспективных исследовательских работ.
Создание высокопроизводительных систем роботов, совершенствование системы научно-технической информации, машинный перевод и многие другие важные проблемы связываются с теорией распознавания образов.
В заключение отметим, что наиболее полным из известных нам обзоров по распознаванию образов является обзор, составленный Кэнелом (85]. В нем все материалы разбиты иа следующие группы: журнальные статьи, книги и обзоры по распознаванию образов, модели автоматического распознавания, методология создания систем распознавания образов, оценка и отбор статистических признаков; размеры обучающих выборок и оценка ошибок, статистические методы распознавания; структурные методы, применение распознавания на практике; будущее распознавания.
Обращает на себя внимание и монография (82], выпущенная известным специалистом по распознаванию образов К. С. Фу, в которой строгий теоретический подход сочетается с широкими практическими приложениями.
Глава II